扫描下载APP
其它方式登录
浙江大学与阿里巴巴联合提出Unified Thinker框架,将图像生成中的逻辑推理(思考)与像素合成(执行)解耦,通过结构化推理轨迹、专用Thinker模块和双阶段强化学习,显著提升开源模型在数独求解、蜡烛燃烧等需时空逻辑推理的视觉生成任务上的准确性与指令遵循能力。
Luma Labs发布首款公开图像生成模型Uni-1,采用自回归Transformer架构,统一文本与图像token序列,支持参考图控制、76种视觉风格及信息图生成;在RISEBench等基准测试中空间推理与参考生成表现领先;提供API定价及免费试用。